import pandas as pd

filename = "building.xls"
# 读取Excel文件
df = pd.read_excel('./data/' + filename,dtype={'id': str, 'org_id': str})
print(df)
print("*" * 50)

# 定义函数来格式化id
def format_id(id_value):
    # 只有在id_value不为空时才进行处理
    if pd.isna(id_value) or id_value == "":
        return id_value  # 返回原值
    # 将id补齐为24位，前四位为6321，中间补0，剩余位置用原id填充
    return f"6321{'0' * (20 - len(id_value))}{id_value}"

# 应用函数格式化id列
df['id'] = df['id'].apply(format_id)
# 应用函数格式化org_id列
df['org_id'] = df['org_id'].apply(format_id)

print(df)
print("*" * 50)

# 将结果保存回Excel文件
df.to_excel('C:/cleaned_' + filename, index=False, engine='openpyxl')

print("已成功格式化并保存。")
